ارائه خصیصه های خاص زبان فارسی جهت بازیابی و بازشناسی کلمات تصویری فارسی با استفاده از تعبیه برچسب
Authors
Abstract:
جستجو و بازیابی کلمات دستنویس در اسناد تصویری روشی جایگزین برای بازشناسی کاراکترهای نوری (OCR) است. این راهکار بیشتر در مواردی که بازشناسی کاراکترهای نوری دقت پایینی دارند، مانند متون دستنویس یا متون چاپی با کیفیت پایینی مطرح میگردد. امروزه یکی از روشهای کارآمد در بازیابی مبتنی بر محتوای تصویر، که برای کلمات تصویری هم توسعه داده شده است، استفاده از رده بندی مبتنی بر خصیصه (Attribute-based Classification) و همچنین تعبیه برچسب (Label Embedding) است. در این مقاله چند خصیصه مختلف مبتنی بر ساختار نگارش زبان فارسی جهت استفاده در بازیابی کلمات تصویری فارسی معرفی شده و نتایج حاصل از روش های مبتنی بر خصیصه های پیشنهادی مقایسه گردیده است. در ارائه خصیصه ها ساختار نگارشی زبان فارسی درنظر گرفته شده است تا بهترین مطابقت را با روش نگارش فارسی داشته باشد. روش مورد مطالعه توانایی بازیابی کلمات تصویری با استفاده از کلمه پرسشی تصویری و متنی را داراست. علاوه بر این میتواند به عنوان روشی جهت بازشناسی کلمات نیز مورد استفاده قرار گیرد. همچنین روش ارائه شده با استفاده از قابلیت رده بندی مبتنی بر خصیصه، توانایی شناسایی کلاس کلماتی که در پایگاه داده آموزشی وجود ندارد را نیز دارا است. آزمایشهای تجربی بر روی دو مجموعه داده استاندارد فارسا و ایرانشهر مورد بررسی قرار گرفته و نتایج حاصل از اجرای روش پیشنهادی قابل قبول است.
similar resources
مدلسازی بازشناسی واجی کلمات فارسی
Abstract of spoken word recognition is proposed. This model is particularly concerned with extraction of cues from the signal leading to a specification of a word in terms of bundles of distinctive features, which are assumed to be the building blocks of words. In the model proposed, auditory input is chunked into a set of successive time slices. It is assumed that the derivation of the underly...
full textساخت موضوعی کلمات مشتق در زبان فارسی
ساخت موضوعـی بـه فهرست موضوعهـای یک محمـول اطلاق میشود. مثلاً، فعل «خورد» دو موضوع و فعل «داد» سه موضوع در ساخت موضوعی خود دارد. معمولاً ساخت موضوعی افعال پس از افزودهشدن یک وند اشتقاقی به آنها تغییر میکند، بهگونهای که ساخت موضوعی مشتق حاصله با ساخت موضوعی کلمۀ پایه متفاوت است. در مقالة حاضر، ساخت موضوعی مشتقات فعلی زبان فارسی و تأثیر وند افزایی بر ساخت موضوعی کلمة پایه را مطالعه میکنیم. چ...
full textبررسی مقابلهای کلمات اندازه گیری زبان فارسی با زبان کردی (گویش سورانی و کردی کلهری) با رویکرد آموزش زبان فارسی به غیر فارسی زبانان
اهمیت و جایگاه زبانشناسی مقابلهای در بررسی تفاوتها و شباهتها میان دو یا بیشتر از دو زبان، بهویژه مقایسۀ زبان فارسی با زبانهای دیگر، نیازمند برنامهریزی و انجام تحقیقات بیشتری است. امروزه، در این زمینه، کارهای زیادی در حوزههای مختلفِ: دستور، آواشناسی، گفتمان، واژگان و حتی بررسی مقابلهای دو متن از دو زبان، به انجام رسیدهاست. درپژوهش حاضر که در زمینۀ واژگان است سعی شده اسمهای اندازهگیر...
full textسیستم برچسب گذاری اجزای واژگانی کلام در زبان فارسی
Abstract: Part-Of-Speech (POS) tagging is essential work for many models and methods in other areas in natural language processing such as machine translation, spell checker, text-to-speech, automatic speech recognition, etc. So far, high accurate POS taggers have been created in many languages. In this paper, we focus on POS tagging in the Persian language. Because of problems in Persian POS t...
full textبازشناسی علامتهای ساکن زبان اشارهی فارسی با استفاده از یک توصیفگر شکلی جدید
در این مقاله یک سیستم برای بازشناسی علامتهای ساکن زبان اشارهی فارسی پیشنهاد شده است. این سیستم بر مبنای یک ویژگی شکلی جدید طراحی شده و قادر است با نرخ تشخیص بالایی، علامتهای ساکن الفبای زبان اشارهی فارسی را به طور خودکار بازشناسی کند. در اینسیستم، ابتدا با استفاده از آنالیز مؤلفهی اصلی (PCA)، جهتهای غالب دست را بدست میآوریم و تصاویر را در جهت غالب دست، به نحوی که سیستم مختصات جدید تصویر ...
full textMy Resources
Journal title
volume 3 issue 1
pages 45- 54
publication date 2016-05-21
By following a journal you will be notified via email when a new issue of this journal is published.
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023